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一 种 改进 的 深度 置信 网 络 在 交通 流 预测 中 的 应 用 
赵 谋 妇 ， 


(兰州 交通 大 学 电子 与 信息 工程 学 院 ， 兰州 730070) 


本 


摘 要 : 针对 现 有 交通 流 预 测 方法 忽视 对 交通 流 数据 自身 特征 的 有 效 利 用 以 及 不 能 模拟 更 复杂 的 数学 运算 ， 提 出 了 一 
种 改进 深度 置信 和 网络 (deep belief network，DBN) 的 交通 流 预测 方法 。 该 方法 结合 深度 置信 网 络 模型 与 Softmax 回归 
作为 预测 模型 ， 利 用 连续 受 限 玻 尔 效 曼 机 〈continuous restricted Boltzmann machines，CRBM) 处 理 输入 特征 向 量 ， 利 
用 自 适应 学 习 步 长 《adaptive learning step，ALS) 减少 RBM 训练 网 络 模 型 时 重建 误差 所 需 的 时 间 ， 用 改进 的 深度 置信 
网 络 模型 进行 交通 流 特征 学 习 ， 在 网 络 顶 层 连接 Softmax 回归 模型 进行 流量 预测 。 实 验 结果 表明 ， 在 实际 的 交通 流 数 
据 预测 中 ， 改 进 的 DBN 模型 的 预测 准确 率 以 及 时 间 复 杂 度 相 比 传统 预测 模型 都 得 到 了 较 好 的 改善 。 
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Application of Improved deep belief network in traffic flow forecasting 


Zhao Shuxu, Cui Fang+ 
(Lanzhou Jiaotong University, School of Electronic & Information Engineering, Lanzhou 730070, China) 


Abstract: In view of the fact that the existing traffic flow prediction methods ignore the efficient use of the traffic flow data 
characteristics and can not simulate more complex mathematical operations, a traffic flow prediction method is proposed to 
improve the deep belief network (DBN) . The proposed method combines deep belief network model and Softmax regression as 
prediction models, and uses the continuous restricted boltzmann machine (CRBM) to process the input eigenvectors and reduces 
the adaptive learning step (ALS) RBM trains the time needed to reconstruct the network model, and uses the improved deep 


belief network model to study the traffic flow characteristics. Softmax regression model is connected to the top of the network 


for traffic prediction. The experimental results show that in the actual traffic flow data prediction, the improved prediction 
accuracy and time complexity of the improved DBN model are better than the traditional prediction model. 


Key Words: traffic flow forecast; deep belief network; continuous restricted boltzmann machine; adaptive learning step 


0 引言 预测 的 精确 性 ， 但 是 没有 考虑 到 在 路 网 当中 交通 状况 之 间 的 时 
空 相关 性 ;jc) 非 参 数 统计 预测 模型 : 神经 网 络 (NN)、KNN 方 

交通 流 预测 作为 交通 控制 和 交通 诱导 的 基础 和 关键 技术 ， 法 、 支持 向 量 机 (SVM) 等 。 由 于 这 种 方法 能 够 很 有 效 地 模拟 交 

是 智能 交通 系统 研究 的 核心 问题 。 实时 、 准确 、 科 学 的 交通 流 预 。 通 流 不 确定 、 复 杂 性 和 非 线 性 等 特点 , 所 以 它 比 其 他 方法 取得 的 


测 技术 可 以 有 效 地 提高 交通 的 通行 效率 和 安全 性 ， 最 大 限度 地 ”效果 更 好 , 但 是 神经 网 络 、 支持 向 量 机 等 预测 模型 均 属 于 浅 层 模 
实现 城市 路 网 运载 能 力 的 合理 利用 , 实现 交通 流 诱导 , 从 而 缓解 ”型 , 在 有 限 样本 和 计算 单元 条 件 下 , 不 能 模拟 更 复杂 的 数学 运算 ， 


了 交通 拥挤 ， 减 少 了 环境 污染 。 并 且 大 量 样本 的 数据 特征 都 是 根据 特定 领域 的 先 验 知识 选择 ， 
现 有 的 交通 流 预测 模型 主要 有 基于 以 往 历史 数据 的 时 间 序 。 忽视 了 对 交通 流 数 据 自 身 特征 的 有 效 利用 。 

列 模型 、 概 率 图 模型 、 非 参数 统计 预测 模型 和 组 合 模型 等 。a) 近年 来 , 深度 学 习作 为 机 器 学 习 的 新 兴学 科 , 一 经 提出 便 受 

基于 以 往 历 史 数 据 的 时 间 序 列 模型 , 自 回归 滑动 平均 模型 ” 到 研究 人 员 的 高 度 关注 。 深 度 学 习 结 构 是 一 个 包含 多 隐藏 层 的 


(ARMA ) 就 是 通过 找到 交通 流 随时 间 变 化 的 模式 , 从 而 实现 预 。 多 层 感知 器 , 它 可 以 通过 学 习 一 种 深层 的 非 线 性 网 络 结构 , 来 
测 。 但 是 这 类 模型 在 实际 应 用 中 需要 依赖 大 量 的 历史 数据 , 受 随 ，” 现 复杂 函数 的 逼近 ， 也 可 以 从 大 量 输入 数据 中 学 习 有 效 的 特 得 
机 干扰 因素 影响 较 大 ,预测 成 本 较 高 ;b) 概率 图 模型 : 贝 叶 斯 网 。” 表示 。 深度 学 习 将 较 低 层 的 输出 作为 更 高 层 的 输入 , 学 习 到 的 高 
络 ， 马 尔 可 夫 链 ， 马 尔 可 夫 随 机 场 等 ,这 些 预测 模型 虽然 提高 了 ” 阶 特征 表示 中 就 包含 输入 数据 的 许多 结构 信息 ， 是 一 种 从 数据 
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缓慢 的 问题 ， 所 以 给 交通 流 
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中 , 使 


针对 以 上 现 有 交通 流 预测 方 
进 的 DBN 模型 。 该 模型 
曼 机 (CRBM) 
学 习 ， 然 后 利 / 


的 深度 学 习 模 型 有 自 
(DBN) 模型 等 。DBN 模型 是 
次 网 络 口 。 


预测 


法 的 问题 ， 


行 交 通 流 预 测 的 文章 还 比较 少 。 
编码 (AE) 模型 


站 。 随 着 深度 学 习 的 深入 研究 , 基于 深度 学 习 的 交通 流 预测 方 
E 在 兴起 , 相 比较 以 往 浅 层 结构 
深度 学 习 来 进 
通 流 预测 方法 中 使 用 到 


的 预测 方法 , 预测 精度 较 高 ， 
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| 练 网 络 模型 


多 个 受 限 玻 尔 
于 RBM 只 能 接受 二 进 
参数 时 收 全 速度 


结果 的 准确 性 带 来 了 挑战 。 
本 文 提出 了 一 种 改 


首先 使 | 
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来 达到 对 交通 流 状 态 的 预测 。 


进行 


在 


j 自 适应 学 习 步 长 (ALS ) 
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实验 结果 表明 , 该 方法 在 交通 


一 个 可 行 、 有 效 的 交通 流 预 涡 
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Hinton 等 人 在 2006 和 
层 组 合成 更 加 抽象 的 高 


征 吕 。 深 度 


网 络 是 一 种 与 浅 
复杂 的 非 线性 系统 建 模 , 通过 为 其 


层 网 络 类 似 的 多 


流 预 测 中 
| 方法 。 


层次 的 特征 向 
E 网 络 模型 
来 实现 特征 参数 
取得 了 不 错 的 ; 


参数 过 程 


的 快速 收敛 。 


住 确 率 ， 碟 


E 提 出 口 。 它 通过 发 现 数据 
慨 来 表示 属性 类 别 或 特 
层次 的 网 络 ， 


全 > 


巴 朋 7/ 


提供 更 高 


高 模型 的 表达 能 力 。 
深度 置信 网 络 模型 
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.1 


干 个 RBM 
逐 层 贪 禁 训 
本 训练 第 
将 RBM 模型 进行 


深度 


和信 网 络 可 以 解释 为 一 个 概率 
堆积 而 成 。 Hinton 等 人 : 


层 的 抽象 特征 , 来 提 


E 成 模型 。 它 是 通过 若 


是 出 了 一 种 可 以 快速 的 非 监 督 


练 DBN 的 方法 四。 根据 深度 学 习 机 制 ， 采 用 输入 样 
层 RBM 单元 ,并 利用 其 输出 训练 第 二 层 RBM 模型 ， 


E 栈 通过 增加 上 


:来 改善 模型 性 能 。 在 无 监督 预 


可 视 层 单元 (Vv ) 对 应 于 输入 ， 隐 蕊 层 单元 (hh ) 对 应 于 特征 探 
测 , 其 隐藏 层 单元 可 以 获取 输入 可 视 层 单元 的 高 阶 相关 性 。 它们 


的 联合 组 态 能 量 方程 (v,h) 为 


EQyv,h) = -> amv 一 Dbh, -> vihw; 
iey jeh ij 


(1) 


其 中 : w 和 广 是 可 视 单 元 输入 i 和 隐藏 单元 特征 j 的 二 进 制 状态 ; 
4 和 4; 分 别 是 它们 的 偏 移 量 ; wi 是 它们 之 间 的 权重 矩阵 。 因 为 
隐藏 节点 之 间 是 条 件 独 立 的 《因为 节点 之 间 不 存在 连接 )， 即 


Pla|y) = [PG 1Y) 
于 


2) 


在 给 定 可 视 层 * 或 者 隐藏 
条 件 概率 分 布 : 


慨 刀 的 基础 上 , 可 以 计算 出 它们 的 


1 


PQv, =1|h) = 
Se 1+exp(-> Wh, —a,) 
d 


G3) 
1 
l+exp(—>,W,v, —b,) 


给 定 一 组 训练 样本 集合 
化 如 下 对 数 似 然 函 数 : 


Plh, =1|v) = (4) 


SI 


其 目标 就 是 最 大 


$={v,y .vy } 时 , 


N 
Ls = > log PC) 


n=1 


(5) 


研究 表明 ， 对 于 RBM 模型 的 训练 ， 使 用 马尔 科 夫 链 
(MCMC) 方法 获得 对 数 似 然 概率 的 无 偏差 估计 ， 并 且 只 需要 
一 定 步 数 的 吉 布 斯 采样 就 能 达到 训练 的 要 求 四 .Hinton 提出 了 一 
种 名 为 对 比 散 度 的 快速 学 习 算 法 来 训练 受 限 玻 尔 兹 曼 机 模型 ， 
该 算法 对 RBM 模型 进行 数据 的 训练 和 各 个 参数 的 更 新 , 既 能 提 
高 学 习 的 计算 速度 ， 又 能 保证 计算 精度 。 


2 CRBM-DBN 预测 模型 研究 
2.1 连续 受 限 波 尔 兹 曼 机 模型 


训练 过 程 中 ，DBN 编码 输入 到 顶层 RBM 后 解码 顶层 的 状态 到 在 传统 RBM 模型 中 ,可 视 层 输入 限制 为 二 进 制 数 (0 或 1)， 
最 底层 单元 实现 输入 的 重 构 。 对 于 模拟 交通 流 这 样 的 连续 值 来 说 是 很 不 方便 的 ， 所 以 提出 了 
1.2， 受 限 玻 尔 兹 曼 机 模型 一 种 连续 受 限 玻 尔 兹 曼 机 模型 《CRBM)， 该 模型 在 线性 单元 中 
RBM 即 受 限 玻 尔 兹 曼 机 ， 它 是 一 个 两 层 的 无 向 图 模型 外 ， 加 入 独立 高 斯 分 布 的 连续 值 来 模拟 真实 的 数据 中 , 使 得 传统 受 限 
包含 一 个 可 视 层 和 一 个 隐藏 层 ， 如 图 1 所 示 。 可 视 层 用 来 表示 。” 玻 尔 兹 曼 机 可 以 处 理 连续 的 输入 向 量 ， 其 能 量 函 数 改 为 
数据 信息 ， 隐 藏 层 用 来 增加 学 习 数 据 的 能 way ， 
ee Ed = E Pbh TY hm @ 
(h) 有 隐藏 层 其 中 : v 表示 可 视 层 第 i 个 真实 值 ，o 是 高 斯 函数 的 标准 方差 向 


| Vy 
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1 RBM 模型 


OO (I 
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Ml 


该 模型 可 视 层 单元 和 隐藏 层 单元 彼此 互 连 ( 层 内 无 连接 ， 


XxX 


别 于 玻 尔 效 曼 机 )， 而 且 它 们 之 间 的 分 布 可 以 表示 为 任意 指数 分 
布 , 在 这 里 是 假设 所 有 可 视 层 单元 和 隐藏 层 单元 均 为 二 值 分 布 。 


量 。 通 过 方程 就 能 让 可 视 层 的 表达 获得 某 个 特定 连续 值 的 优先 
权 ， 根 据 能 量 方程 ， 得 到 它们 的 条 件 概率 分 布 为 
pO |D= ND, +0, Po) 0) 
j=1 
pl |v) =sigm( vw, +a)) (8) 
i=l 


CRBM 训练 以 及 更 新 参数 的 过 程 与 传统 RBM 没有 什么 区 
都 可 以 运用 对 比 散 度 (CD) 算法 对 其 参数 进行 调整 。 
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别 ， 
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用 mini-batch 梯度 下 
优 。 通 过 之 前 的 描 ; 


信 网 络 模型 结构 包括 一 个 CRBM、 两 个 
经 网 络 节 点 。 
训练 , BP 网 络 采用 有 监督 机 制 进行 训练 。 整 个 训 
地 做 到 减少 原始 输入 数据 的 遗漏 中。 
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2.3 自 适应 学 习 步 长 
一 般 来 说 ， 训 练 DBNs 是 一 个 计算 上 比较 复杂 的 过 程 ， 因 


为 它 涉 及 到 独立 的 进行 几 个 RBMs 的 训练 ， 
长 的 时 间 。 此 外 , 选择 适 
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每 个 权重 连接 wy 的 个 人 学 习 率 〈 步 长 ) 参 
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的 交通 流量 序列 对 于 某 条 道路 的 人 +A 时 间 
量 的 预测 ， 其 中 Ar 可 以 进行 调节 [9 。 
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过 高 斯 分 布 处 理 并 且 进 行 特征 
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通 流 时 间 序 列 的 一 个 特征 代表 模型 x 。 经 过 特 
后 ,以 往 的 交通 流 时 间 序 列 X 可 通过 已 转换 为 另 


空间 Y ， 即 有 五 (x) 一 了 ， 然 后 给 定 一 组 特征 空间 了 
的 配对 组 合 表 示 为 {C3,2),(%,2),… 

=CG(CO) 03, 通过 最 小 化 
合 的 参数 


标 损耗 函数 工 , 得 到 


LZ:W)=|z2-GOo 


在 训练 整个 预测 网 络 模型 参数 的 过 程 中 ， 利 用 
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学 习 ， 可 以 得 到 代表 以 往 历史 交 
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1 模型 型 
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步 长 策略 , 进一步 加 快 
缓慢 的 问题 。 


训练 参数 的 收敛 速度 , 解决 ] 


其 收敛 速度 


CRBM-DBN 预测 模型 的 训练 包括 预 训练 和 微调 两 个 部 分 ， 


过 程 如 下 : 

a) 预 训 练 阶 段 。 使 用 CRBM-DBN 预测 模型 
交通 流 数 据 进 行 重 构 。 
X(1),1 =1,2, .… ,7T ,其 经 雹 
其 中 7 是 一 个 正 整 数 ,，n 是 输入 空间 的 维 
是 如 果 t 一 + < 0, 则 设置 重 构 之 后 的 数 


算法 对 输入 的 


输入 原始 时 间 序 列 数据 为 
过 重 构 后 为 X(t 一 7), X(t 一 27),.…， 
数 , 并 且 t-nr<7T。 但 
表示 为 X(1 一 7) = x(1) 。 


X(t —nT), 


b) 微调 阶段 。 在 网 络 模型 顶层 利用 BP 算法 


数据 进行 自 上 而 下 的 参数 微调 叶 。 由 于 模型 预 训 
经 接近 于 训练 好 的 值 ， 那么 再 做 BP 算法 时 ， 只 需 
数 里 进行 一 个 局 部 搜索 03 即 可 。 


H 
出 J 


选择 适 


种 使 用 自 适 
天 训 


练 收敛 速度 的 问题 。 


ALS 方法 是 使 月 


应 学 习 步 长 (ALS ) 方法 0 来 


来 解决 


RBM 在 训练 网 络 参数 时 收敛 速度 缓慢 的 问题 。 在 每 个 CD-k 的 


和 迭代 中 ， 步 长 根据 符号 变化 进行 调整 
um | (人 人 lw 六 -(vh 六 )> 
仿 且 (9) 
dm | (人 -(vh) . )N( vh) -人 而 六 ja 
其 中 u>1 (向 上 ) 表示 步 长 的 增 量 因子 ，4d <1 (向 下 〉 表 示 步 
长 的 减 量 因子 。 如果 两 个 连续 的 更 新 具有 相同 的 方向 , 则 该 特定 
权重 的 步 长 增加 。 对 于 相反 方向 的 更 新 , 步 长 减 小 从 而 避免 学 
习 过 程 中 由 于 过 多 的 学 习 速 率 而 产生 的 振荡 。 该 过 程 的 基本 思 
想 是 找到 可 以 绕 过 错误 表面 峡谷 上 的 近似 的 最 佳 步 长 。 
2.4 CRBM-DBN 预测 模型 算法 
给 予 一 个 给 定 的 路 段 ， 设 X; 表示 第 i 个 交通 道路 在 第 1 时 


间 的 交通 流量 ， 那 么 给 定 


局 


X(N) 


个 观察 得 到 的 交通 流量 序列 表示 为 


(10) 


算法 过 程 如 图 3 所 示 。 


交通 流 状 态 的 时 间 序 列 数据 


了 
采用 高 斯 分 布 初始 化 RBM 的 输入 


使 用 自 适应 学 习 步 长 (ALS) 策略 


Y 
通过 CD 过 程 训练 第 一 层 的 CRBM 


lL 体 的 CRBM-DBN 


使 用 有 标签 和 
练 后 的 参数 已 
需要 在 已 知 的 参 
预测 模型 


< 


把 CRBM 的 输出 作为 上 层 RBM 的 输入 ， 训 练 RBM 


四 


六 一- 


把 RBM 的 输出 作为 上 层 RBM 的 输入 ， 
M 


执行 完 给 
_ 定 的 层 数 


训练 RBM 


匡 


是 
Y 


最 后 一 个 RBM 的 输出 作为 顶层 回归 层 的 输入 ， 随 机 初始 化 其 


Y 
| 通过 有 监督 的 BP 方 法 微调 整个 架构 的 参数 


图 3 CRBM-DBN 预测 模型 算法 流程 图 
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通过 训练 出 来 的 CRBM-DBN 模型 算法 就 可 以 作为 交通 流 


赵 底 旭 ， 等 : 一 种 改进 的 深度 置信 网 络 在 交通 流 预测 


由 图 4 可 以 看 出 ， 本 文 提出 的 预测 模型 的 预测 结果 与 实际 


数据 的 预测 模型 , 即 当 给 定 一 组 输入 数据 后 , 便 会 得 到 对 应 道路 
的 预测 输出 。 


3 ”实验 结果 及 分 析 


3.1 实验 数据 描述 

模型 的 仿真 和 验证 工作 基于 山东 省 淄博 市 的 某 局 部 区 域 上 
控 数 据 开 展 。 依 据 官方 提供 的 该 区 域 交 通 历 史 监 控 数 据 进行 梳 
里 得 到 实验 的 样本 数据 集 。 包含 有 每 隔 15 min 的 交通 平 
均 路 途 消耗 时 间 、 速 度 与 交通 流量 , 并 且 数据 履 盖 了 淄博 市 的 城 
市 主干 道 。 在 此 选取 淄博 市 临淄 区 和 张 店 区 之 间 的 五 条 主要 城 
市 道路 ， 分 别 是 临淄 大 道 ， 桓 公路， 宏 达 路 ， 张 皇 路 ， 古 候 路 。 
根据 预测 模型 的 构建 需求 , 需 分 别 整理 两 类 学 习 集 , 即 特征 学 习 
集 和 分 类 学 习 集 。 选 取 其 2015 年 8 月 份 的 数据 ， 共 有 30 天 数 
据 。 其 中 前 29 天 的 数据 用 以 训练 模型 ,后 1 天 的 数据 用 以 测试 。 
3.2 ”性 能 指标 

为 了 能 够 更 好 的 分 析 预 测 效果 ， 使 用 两 个 最 常见 的 性 能 指 
标 参 数 为 绝对 平均 误差 (MAE) 和 相对 平均 误差 (MRE), 定义 
如 下 : 

绝对 平均 误差 (MAE ) 


~ 


bata 
洋 
应 

I 


1 
MAE 一 N > ， 了 (D Yo (D) (12) 


相对 平均 误差 (MRE): 
1 < Ya (D -VoD 
MRE= 72, yD (13) 

Zu :交通 流量 预测 值 ,Yi :实际 的 交通 流 数值 。 在 这 里 选择 了 
MAE 与 MRE 作为 衡量 标准 。 
3.3 ”实验 结果 

实验 程序 在 Windows 7 64 位 系统 mntel-I7 CPU、32 GB 内 存 
的 高 配置 计算 机 上 进行 ， 编 码 在 pycharm-professional 平台 下 完 
成 。 在 深度 体系 架构 中 ， 需 要 决定 DBN 模型 的 输入 层 大 小 ， 隐 
藏 层 层 数 以 及 其 每 一 层 的 节点 个 数 ， 其 中 隐藏 层 层 数 和 其 每 一 
展 的 节点 个 数 需要 大 量 的 测试 来 选 定 。 在 此 选取 五 条 道路 的 前 
两 个 时 间 段 的 交通 流量 作为 输入 ， 即 共 10 个 输入 ,桓公 路 作为 
其 预测 输出 。 选 定 隐藏 层 为 深层 结构 {10，12，10，8，6，4}， 
通过 训练 以 后 对 桓公 路 第 30 天 做 预测 的 结果 如 图 4 所 示 。 


图 4 预测 值 和 实际 值 的 对 比 结果 


交通 流 数 据 偏差 很 小 ， 反 映 了 交通 流 随 时 间 变 化 的 基本 规律 。 

实验 中 对 训练 CRBM-DBN 模型 的 微调 阶段 里 BP 过 程 的 调 
饱 次 数 epochs 做 了 调整 测试 ， 结 果 发 现 大 于 某 个 数量 时 ， 模 型 
的 预测 结果 对 于 和 迭代 次 数 的 调整 并 没有 特别 大 的 影响 。 这 也 印 
证 了 模型 在 预 训练 阶段 时 参数 的 调整 已 经 近乎 较 优 的 判断 。 模 
型 的 预 训练 结果 如 图 5 所 示 。 


i 


0 5 加 5 20 站 Ed 四 的 必 EJ 


epoch 


图 5 预 训练 结果 显示 


由 图 5 可 以 看 出 , 随 着 RBM 层 数 增加 ,整体 损失 会 逐渐 减 
小 , 这 可 以 说 明 预 训练 这 一 过 程 可 以 预先 训练 出 较 好 的 参数 值 。 
3.4 本 文 算法 与 其 他 算法 比较 
3.4.1 预测 准确 率 比 较 

为 了 进一步 验证 本 文 提出 的 预测 模型 的 有 效 性 ， 使 用 本 文 
方法 与 传统 RBM-DBN 模型 以 及 CRBM-DBN 模型 算法 相 比 较 。 
每 种 算法 都 使 用 相同 的 数据 集 进行 实验 。 三 种 算法 的 性 能 指标 
对 比如 表 1 所 示 。 


表 1 人 性 能 指标 对 比 


方法 MAE MRE 
RBM-DBN 20.98 0.758 
CRBM-DBN 15.53 0.354 
CRBM-DBN (ALS) 15.35 0.335 
09 
08 pe 
07 wa -4# 
BE 
06 pe 07” 
_* a J 
生 05 2 “pe Re 
Ea i a 
脏 04 A 
医 和 一 过 
0.3 ps a 
¥@ 
02[ 人 ~ 
时 一 汪 一 RBM-DBN 
oO1r 一 人 一 CRBM-DBN 
“了 一 本 一 CRBM-DBN(ALS) 
4 


100 200 30 400 500 6o0 700 800 900 1000 
选 代 次 数 


图 6 三 种 算法 的 准确 率 对 比 


从 图 6 中 可 以 看 出 ， 在 迭代 次 数 较 小 的 时 候 ， 三 种 算法 准 
确 率 差距 并 不 是 很 大 , 但 是 随 着 迭代 次 数 增加 , 本 文 方法 预测 准 
确 率 是 随 着 迭代 次 数 增加 而 逐渐 上 升 ， 最 终 维持 在 85% 左 右 ; 
而 传统 RBM-DBN 模型 和 CRBM-DBN 模型 也 是 随 着 迭代 次 数 
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的 增加 而 预测 ; 
率 只 旨 
左右 。 


对 确 率 逐 渐 上 升 的 ， 但 传统 RBM-DBN 模型 准 


确 


E 持 在 67% 左 右 ,而 CRBM-DBN 模型 准确 率 给 


上 述 的 实验 结果 分 析 可 知 ， 本 文 方法 中 的 


持 在 了 80.8% 


CRBM-DBN 


(ALS) 模型 以 及 CRBM-DBN 模型 与 传统 RBM-DBN 模型 相 


比 ， 预 测 精度 要 有 所 提高 。 


小 时 交通 流量 


图 7 两 种 预测 模型 与 实际 交通 流量 对 比 


从 图 


文 的 CRBM-DBN (ALS) 模型 要 比 CRBM-DBN 


实际 的 交通 流量 曲线 。 
3.4.2 时 间 复 杂 度 比较 
RBM 基于 CD 的 快速 学 习 算 法 


7 中 可 以 看 出 ， 在 对 实际 交通 流量 的 预测 结果 中 ， 
模型 更 加 接近 


差 急剧 增加 , 权重 


通常 采用 一 个 全 局 
步 长 来 对 网 络 进行 训练。 然而， 学 习 步 长 若 过 大 , 将 导致 
也 会 变 得 异常 大 ; 学 习 步 长 过 小 可 避免 上 
况 出 现 ， 但 收敛 速度 较 慢 ,训练 时 间 过 长 ， 为 解决 这 一 矛盾 ,在 


所 以 只 将 本 文 CRBM-DBN (ALS) 
模型 以 及 CRBM-DBN 模型 与 实际 交通 流量 作 比 较 ， 如 图 


| 三 i 站 
300 7 \ 
\ 


7 所 示 。 


本 


溺 膏 准 


误 
情 
在 


CRBM-DBN 模型 中 引入 了 自 
型 训练 的 时 间 。 在 


适应 学 习 步 长 的 实验 


适应 学 习 步 长 ， 可 以 有 效 的 减少 模 
,将 自 适应 学 习 率 与 


三 种 不 同 的 固定 学 习 率 值 (7= 0.1，7= 0.5 和 7= 0.9) 进行 比 


较 。 对 于 
增 量 上 和 减 数 4 的 值 分 别 取 为 1.2 和 
同 的 取 值 测试 (三 种 / 


自 适应 步 长 来 说 ， 每 个 连接 的 初始 学 习 率 设置 为 0.1， 


0.6。 总 共 设 置 了 十 二 种 不 

于 自 适 应 步 长 ， 另 外 九 种 用 于 固定 学 习 

率 )， 每 个 测试 都 以 不 同 的 权重 开始 ， 但 是 为 了 公平 起 见 ， 每 个 
相同 的 权重 值 。 图 8 显示 了 


测试 都 会 根据 正在 执行 的 测试 使 ) 


不 同学 习 速率 7 的 均 方 根 误 差 (RMSE) 的 变化 。 可 以 看 出 ， 自 
适应 学 习 率 优 于 所 有 的 固定 学 习 率 。 对 于 固 


7 =0.5 的 结果 最 好 ， 而 7= 0.9 的 结果 最 差 。 


- 
一 莱 本 有 
一 一 =01 | 
一 一 和 = 人 5 

一 一 0=09 | 


定 学 习 率 来 说 , 设置 


01 1 hn P 1 1 1 1 1 
0 10 20 30 40 50 60 70 80 90 1000 
选 代 次 数 


图 8 不 同学 习 率 的 RMSE 


赵 庶 旭 ， 等 : 


IE 


一 种 改进 的 深度 置信 网 络 在 交通 流 预测 " 


通过 使 用 自 适 


VY 步 长 ， 


本 文 不 再 


需要 搜索 合适 的 7 参数 ,此 


外 , 它 可 以 很 容易 地 从 不 良 选择 中 恢复 初始 学 习 率 ， 


和 4d 容易 调整 。 


且 参 数 


表 2 给 出 了 各 个 算法 的 时 间 复 杂 度 ,本文 CRBM-DBN(ALS) 
方法 的 时 间 复 杂 度 为 18.15， 比 RBM-DBN 方法 快 了 7.72， 比 
CRBM-DBN 方法 快 了 5.58。 引 入 高 斯 分 布 的 CRBM-DBN 方法 
对 传统 的 RBM-DBN 方法 来 说 ， 收 敛 速度 影响 不 算 很 大 ， 但 是 


大 大 提高 了 训练 速度 。 


表 2 
方法 
RBM-DBN 


CRBM-DBN 


CRBM-DBN (ALS) 


从 以 上 实验 结果 综合 分 析 可 以 得 出 ， 使 / 
RBM-DBN 方法 以 及 CRBM-DBN 方法 相 比 , 预测 ; 


间 复 杂 度 有 较 大 幅度 的 改善 。 


在 CRBM-DBN 方法 基础 上 加 入 ALS 方法 就 加 快 了 收敛 速度 ， 


算法 时 间 复 杂 度 比较 


时 间 复 杂 度 (s) 


25.87 
23.73 


18.15 


本 文 方法 与 传统 
住 确 率 以 及 时 


图 9 


图 10 18:25-18:30 时 


17:40-17:45 时 间 段 结果 显示 


间 段 结果 显示 


为 了 使 交通 流 预 测 的 情况 更 为 直观 的 显示 , 应 


ArcGIS 在 


每 个 时 间 段 可 视 化 出 预测 的 热度 图 。 


以 及 图 10 所 示 。 图 中 绿色 较 深 


其 热度 图 的 显示 效果 如 图 9 


的 部 分 表示 交通 状态 为 畅通 ， 绿 


轻 度 拥 堵 ， 中 度 拥 堵 ， 严 重 拥堵 。 


色 较 浅 的 部 分 表示 交通 状态 为 基本 畅通 ， 随 着 颜色 部 分 的 变化 
情况 , 来 说 明 交 通 流 状态 的 五 个 状态 , 分 别 是 畅通 ， 


基本 畅通 ， 
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4 ”结束 语 


本 文 提出 了 一 种 基于 CRBM-DBN 模型 的 交通 流 预测 方法 。 
其 中 针对 RBM 只 能 接受 二 进 制 输入 而 导致 数据 丢失 问题 , 提出 
了 带 有 高 斯 分 布 的 CRBM 模型 ， 以 及 其 在 训练 网 络 模型 参数 时 
收敛 速度 缓慢 问题 , 提出 了 一 种 自 适应 学 习 步 长 的 解决 方法 , 在 
每 次 迭代 中 , 该 方法 寻求 近似 最 佳 步 长 来 提高 收敛 速度 。 实验 结 
果 表 明 ， 用 本 文 提出 的 预测 方法 预测 出 的 值 与 真实 值 基本 吻合 ， 
且 预 测 精度 较 高 ， 是 一 种 有 效 的 交通 流 预测 方法 。 
于 本 文 CRBM-DBN (ALS) 模型 算法 的 复杂 性 ， 其 时 间 
复杂 度 的 简化 仍然 是 未 来 研究 的 重点 。 如 果 该 模型 能 够 并 行 训 
练 , 则 会 大 大 提高 训练 的 速度 。 此外， 本文 只 是 对 交通 路 段 中 单 
个 断面 的 输出 进行 预测 ， 多 断面 输出 预测 还 需要 进一步 研究 。 
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